Besøkstatistikken viser data fra 1. januar til 9. mars per år.
Sykepleier, Ingeniør, Psykolog, Lege, Advokat og Helefagarbeider går igjen blant de 10 mest besøkte yrkene både i 2013 og 2021.Dette er statusyrker og/eller knyttet til helse.
## [1] "Sykepleier" "Ingeniør" "Psykolog" "Eiendomsmegler"
## [5] "Lege" "Sosionom" "Advokat" "Siviløkonom"
## [9] "Fysioterapeut" "Helsefagarbeider"
## [1] "Sykepleier" "Psykolog" "Advokat"
## [4] "Lege" "Lærer" "Ingeniør"
## [7] "Ambulansearbeider" "Elektriker" "Pilot"
## [10] "Helsefagarbeider"
Sykepleier er det klart mest besøkte yrket (med untak av i 2014 der ingeniør lå høyest). I 2021 har 67 400 (0,85 prosent) besøkt yrketbeskrivelsen. Neste på lista er psykolog med 36 300 (0,46 prosent). Sykepleier nesten dobbelt så mange besøk som psykolog.
## # A tibble: 10 x 4
## Yrke year rank_ansatte rank_ansatte_gruppe
## <chr> <int> <dbl> <chr>
## 1 Sykepleier 2021 0.989 Høyt antall ansatte
## 2 Psykolog 2021 0.820 Høyt antall ansatte
## 3 Advokat 2021 0.783 Middels antall ansatte
## 4 Lege 2021 0.944 Høyt antall ansatte
## 5 Lærer 2021 0.995 Høyt antall ansatte
## 6 Ingeniør 2021 0.993 Høyt antall ansatte
## 7 Ambulansearbeider 2021 0.754 Middels antall ansatte
## 8 Elektriker 2021 0.923 Høyt antall ansatte
## 9 Pilot 2021 0.643 Middels antall ansatte
## 10 Helsefagarbeider 2021 0.986 Høyt antall ansatte
## # A tibble: 10 x 4
## Yrke year rank_ansatte rank_ansatte_gruppe
## <chr> <int> <dbl> <chr>
## 1 Sykepleier 2013 0.989 Høyt antall ansatte
## 2 Ingeniør 2013 0.993 Høyt antall ansatte
## 3 Psykolog 2013 0.820 Høyt antall ansatte
## 4 Eiendomsmegler 2013 0.801 Høyt antall ansatte
## 5 Lege 2013 0.944 Høyt antall ansatte
## 6 Sosionom 2013 0.916 Høyt antall ansatte
## 7 Advokat 2013 0.783 Middels antall ansatte
## 8 Siviløkonom 2013 0.871 Høyt antall ansatte
## 9 Fysioterapeut 2013 0.810 Høyt antall ansatte
## 10 Helsefagarbeider 2013 0.986 Høyt antall ansatte
df.4 <- ga_pw_utdanningno_data %>%
filter(page_views_pst < 1, year == 2021 | year== 2013, page_type == "yrke") %>%
select(page_title, year, page_views_pst, page_views) %>%
arrange(desc(page_views_pst))
freq <- data.frame(table(df.4$page_title)) #number of occurences
yrke.2years <- as.character(freq$Var1[freq$Freq == 2]) #finding ocupations with both years
df.5 <- df.4[df.4$page_title %in% yrke.2years,] #excluding ocupations with only one occurence
# df.5 <- df.5[order(df.5$page_title),]
df.5.13 <- df.5[df.5$year == 2013,] #object for 2013
#df.5.13 <- df.5.13[order(df.5.13$page_title),]
df.5.13 <- arrange(df.5.13, page_title)
df.5.21 <- df.5[df.5$year == 2021,] #object for 2021
df.5.21 <- arrange(df.5.21, page_title)
#test that both years are sorted correct
all.equal(df.5.13[,1], df.5.21[,1]) #should be true
## [1] TRUE
#new df with difference 2021 and 2013
diff <- data.frame(df.5.13$page_title, df.5.13$page_views_pst, df.5.21$page_views_pst, df.5.21$page_views_pst-df.5.13$page_views_pst)
names(diff) <- c("page_title", "page_views_pst_13", "page_views_pst_21", "increase_page_views_pst")
diff <- arrange(diff, desc(increase_page_views_pst))
diff.1 <- bind_rows(slice_head(diff,n=5), slice_tail(diff, n=5)) #looking only at a few
diff.2 <- bind_rows(slice_head(diff,n=20), slice_tail(diff, n=20)) #looking only at some more
View(diff.2)
# Plot occupations with largest effect
diff.long <- diff.1 %>%
gather("year", "page_views_pst", page_views_pst_13:page_views_pst_21)
c <- ggplot(diff.long, aes(x=as.character(year), y=page_views_pst*100, group= page_title))
c + geom_line(aes(color= page_title), size= 1) + xlab("År") + ylab("Prosentandel av sidevisninger") + labs(color= "Yrke", title = "Endring i prosentandel sidevisinger til de yrkene m størst endring fra 2013 til 2021")
### Ser på utvikling for utdanningsbeskrivelser
dfu.21 <- ga_pw_utdanningno_data %>%
filter(page_views_pst < 1, year == 2021, page_type == "utdanningsbeskrivelse") %>%
slice_max(page_views_pst, n=10) %>%
select(page_title, year, page_views_pst, page_views) %>%
arrange(desc(page_views_pst))
dfu.13 <- ga_pw_utdanningno_data %>%
filter(page_views_pst < 1, year == 2013, page_type == "utdanningsbeskrivelse") %>%
slice_max(page_views_pst, n=10) %>%
select(page_title, year, page_views_pst, page_views) %>%
arrange(desc(page_views_pst))
(top10.13u <- dfu.13$page_title)
## [1] "Sykepleie" "Juss"
## [3] "Barnevern" "Medisin"
## [5] "" "Psykologi"
## [7] "Fysioterapi" "Ingeniør"
## [9] "Pedagogikk" "Økonomisk-administrative fag"
(top10.21u <- dfu.21$page_title)
## [1] "Sykepleie" "Psykologi"
## [3] "Juss" "Økonomisk-administrative fag"
## [5] "Sosialt arbeid (sosionom)" "Videreutdanning for sykepleiere"
## [7] "Arkitektur" "Barnevern"
## [9] "Politiutdanning" "Vernepleie"
#Ser på prosentandel av sidevisninger over tid for de mest beøskte utdanningsbeskrivelsene i 2013 and 2021
dfu.1 <- ga_pw_utdanningno_data %>%
filter(page_views_pst < 1, page_type == "utdanningsbeskrivelse") %>%
select(page_title, year, page_views_pst, page_views) %>%
arrange(desc(page_views_pst))
dfu.2 <- dfu.1[dfu.1$page_title %in% top10.21u,]
e <- ggplot(dfu.2, aes(x=as.character(year), y=page_views_pst*100, group= page_title))
e + geom_line(aes(color= page_title), size= 1) + xlab("År") + ylab("Prosentandel av sidevisninger") + labs(color= "Utdanningsbeskrivelse", title="Utvikling til de mest besøkte Utdanningsbeskrivelsene i 2021")
dfu.3 <- dfu.1[dfu.1$page_title %in% top10.13u,]
b <- ggplot(df.3, aes(x=as.character(year), y=page_views_pst*100, group= page_title))
b + geom_line(aes(color= page_title), size= 1) + xlab("År") + ylab("Prosentandel av sidevisninger") + labs(color= "Yrke", title="Utvikling til de mest besøkte Utdanningsbeskrivelsene i 2013")
dfu.4 <- ga_pw_utdanningno_data %>%
filter(page_views_pst < 1, year == 2021 | year== 2013, page_type == "utdanningsbeskrivelse") %>%
select(page_title, year, page_views_pst, page_views) %>%
arrange(desc(page_views_pst))
freq.u <- data.frame(table(dfu.4$page_title)) #number of occurences
ut.2years <- as.character(freq.u$Var1[freq.u$Freq == 2]) #finding ocupations with both years NB: Some education programs have 3 or 4 occurences
dfu.5 <- dfu.4[dfu.4$page_title %in% ut.2years,] #excluding ocupations with more or less occurences
dfu.5.13 <- dfu.5[dfu.5$year == 2013,] #object for 2013
dfu.5.13 <- arrange(dfu.5.13, page_title)
dfu.5.21 <- dfu.5[dfu.5$year == 2021,] #object for 2021
out <- data.frame(table(dfu.5.21$page_title)) #Helseadminstrasjon comes twice in 2021
out <- as.character(out$Var1[out$Freq != 1])
dfu.5.21 <- dfu.5.21[! dfu.5.21$page_title %in% out,]
dfu.5.21 <- arrange(dfu.5.21, page_title)
#test that both years are sorted correct
all.equal(dfu.5.13[,1], dfu.5.21[,1]) #should be true
## [1] TRUE
#new df with difference 2021 and 2013
diff.u <- data.frame(dfu.5.13$page_title, dfu.5.13$page_views_pst, dfu.5.21$page_views_pst, dfu.5.21$page_views_pst-dfu.5.13$page_views_pst)
names(diff.u) <- c("page_title", "page_views_pst_13", "page_views_pst_21", "increase_page_views_pst")
diff.u <- arrange(diff.u, desc(increase_page_views_pst))
diff.u1 <- bind_rows(slice_head(diff.u,n=5), slice_tail(diff.u, n=5)) #looking only at a few
diff.u2 <- bind_rows(slice_head(diff.u,n=20), slice_tail(diff.u, n=20)) #looking only at some more
View(diff.u2)